2023天天弄国产大片_男人的天堂v在线播放_精品久久这里_久久久无码国产精精品免费国国产欧美日本韩高清视频一区二区三区免费式_成全视频免费观看在线下载

炫科技
芥子納須彌,大模型實(shí)現(xiàn)端雲協(xié)同難度有多大?

大模型炙手可熱,不過(guò)正在形成兩(liǎng)大陣營(yíng)。

一方面,是越來(lái)越強(qiáng)的雲側大模型。從文生視頻的Sora,到最近在實(shí)時(shí)語音交互上令人印象深刻的GPT-4o,以及國(guó)內(nèi)上百款大模型都是這樣。在華為開(kāi)發(fā)者大會(huì)2024(HDC 2024)上,華為雲重磅發(fā)布的盤(pán)古大模型5.0,在多模態(tài)理解、複雜邏輯推理等方面的表現(xiàn),更是備受矚目。

另一方面,是大模型走向端側。包括華為、榮耀、OPPO、vivo等手機(jī)廠(chǎng)商,以及聯(lián)想等PC廠(chǎng)商,都推出了AI端側大模型。最近舉行的WWDC24上,蘋果也發(fā)布了本地運(yùn)行的Apple Intelligence。

那麼問(wèn)題來(lái)了,端側大模型和雲側大模型到底誰代表著未來(lái)?AI時(shí)代的發(fā)展方向到底是什麼?

大模型時(shí)代的終極範式 

「深度學(xué)習(xí)之父」 Geoffrey Hinton曾經(jīng)暢想過(guò)這樣的場(chǎng)景:「會(huì)有一個(gè)階段,一旦某個(gè)AI系統(tǒng)訓(xùn)練完畢,我們會(huì)將其運(yùn)行在非常低功耗的系統(tǒng)上,所以,如果你想讓你的烤麵包機(jī)能和你對(duì)話(huà),你需要一個(gè)只花費(fèi)幾美元的晶片,而且它能運(yùn)行像ChatGPT這樣的程序。」

端側大模型之所以會(huì)出現(xiàn),歸結(jié)起來(lái)有這麼幾個(gè)原因:一是雲側大模型推理成本比較高;二是在端側運(yùn)行的大模型可以保護(hù)數(shù)據(jù)隱私;三是在一些沒有網(wǎng)絡(luò)連接的場(chǎng)景下,可以使用本地算力來(lái)支持大模型的運(yùn)行。IDC預測(cè),到2026年中國(guó)市場(chǎng)近50%的終端設(shè)備處理器將帶有AI引擎,由此可以看到端側大模型的發(fā)展迅速。

不過(guò),端側大模型也有其不足。IDC中國(guó)高級(jí)分析師郭天翔表示,目前端側的算力要求比較高,功耗比較大,更為重要的是端側大模型的參數(shù)量級(jí)無(wú)法和雲側的通用大模型相比。縱觀(guān)市面上的大模型,相比雲測(cè)大模型動(dòng)輒百億、千億參數(shù),端側大模型大多參數(shù)量級(jí)比較小,如蘋果的端側大模型為30億參數(shù)。

目前業(yè)界越來(lái)越認(rèn)同,端側大模型和雲側大模型並不是競(jìng)爭(zhēng)關(guān)係,而是協(xié)同關(guān)係。部分智能推理任務(wù)或者推理任務(wù)的部分階段放到端側進(jìn)行處理,可以發(fā)揮端側大模型本地即時(shí)處理的優(yōu)勢(shì),而且用戶(hù)原始數(shù)據(jù)不離開(kāi)本地,可以保護(hù)數(shù)據(jù)安全隱私。同時(shí),需要更強(qiáng)能力、更深思考的時(shí)候,可以使用雲側大模型。雙方優(yōu)勢(shì)互補,相得益彰,最大程度地發(fā)揮端側大模型和雲側大模型的優(yōu)勢(shì)。

舉個(gè)例子,如果你對(duì)某篇文章做摘要,可以使用端側大模型,而要寫(xiě)一篇論文查閱該領(lǐng)域的歷史性資料,就只能使用雲側大模型。IDC在預測(cè)2024年AI發(fā)展趨勢(shì)時(shí),也將端雲結(jié)合確定為其中之一,其指出端側大模型的安全性和及時(shí)性與雲側大模型的豐富功能和算力將實(shí)現(xiàn)很好結(jié)合。

以華為為例,小藝背後的大模型就擁有端側和雲側兩(liǎng)種形態(tài),可以針對(duì)不同設(shè)備和場(chǎng)景的需求進(jìn)行處理。端側大模型會(huì)對(duì)用戶(hù)請求和上下文信息做預處理,然後將需求發(fā)到雲端,最大化發(fā)揮端側的速度與雲側的強(qiáng)大。同樣,蘋果入局大模型,也是採用端雲協(xié)同的方式。

在HDC 2024上,鴻蒙原生智能(Harmony Intelligence)發(fā)布,就是採用端雲協(xié)同的架構(gòu)。端側的個(gè)人數(shù)據(jù)與用戶(hù)意圖,和雲側的智能中樞互相配合,高效協(xié)同。

端雲協(xié)同才是大模型時(shí)代的終極範式。

端雲協(xié)同的大模型,有多難?

不過(guò),端雲協(xié)同說(shuō)起來(lái)容易,實(shí)際實(shí)現(xiàn)起來(lái)難度很大。

端側大模型的實(shí)現(xiàn)路徑大致是這樣的,通常是雲側大模型通過(guò)剪枝、量化、蒸餾等模型壓縮和加速技術(shù),給大模型減重,然後再根據(jù)終端的特點(diǎn)和用戶(hù)需求進(jìn)行針對(duì)性的訓(xùn)練。例如,華為小藝的端側大模型就重點(diǎn)針對(duì)語音對(duì)話(huà)、設(shè)備操作、購(gòu)物、生活常識等場(chǎng)景進(jìn)行訓(xùn)練,而且還對(duì)提示詞和輸(shū)出格式進(jìn)行了壓縮,將推理時(shí)延縮短了一半。

顯然,這個(gè)過(guò)程就要求廠(chǎng)商對(duì)於雲側大模型和端側大模型都需要有深刻理解和豐富經(jīng)驗(yàn)。而且,如何將任務(wù)在兩(liǎng)種大模型間進(jìn)行分配,如何實(shí)現(xiàn)端側和雲側的良好配合,如何保護(hù)數(shù)據(jù)隱私等等,對(duì)於廠(chǎng)商來(lái)說(shuō)都是極大的考驗(yàn)。華為常務(wù)董事、終端BG董事長(zhǎng)、智能汽車(chē)解決方案BU董事長(zhǎng)餘承東表示,華為早在2017年就開(kāi)啟Mobile AI時(shí)代,持續(xù)耕耘終端AI體驗(yàn)創(chuàng)新,從2018-2020年的個(gè)人終端AI化,以及2021-2022年的全場(chǎng)景設(shè)備AI化,到2023-2024年以AI大模型賦能終端,都是這樣。

站在這個(gè)角度看華為雲,就可知其在端雲協(xié)同上的獨(dú)特性。因為華為幾乎是業(yè)界唯一同時(shí)擁有雲側大模型和端側大模型,以華為雲作為統(tǒng)一雲底座,打造了昇騰、鯤鵬、鴻蒙、歐拉、GaussDB等根技術(shù)及相關(guān)生態(tài),並實(shí)現(xiàn)領(lǐng)先的廠(chǎng)商。在雲側,早在2021年華為就發(fā)布了盤(pán)古大模型,包括NLP大模型和CV大模型,並在這幾年持續(xù)迭代,最新發(fā)布的盤(pán)古大模型5.0最大的特點(diǎn)是在多模態(tài)上有了突飛猛進(jìn)的進(jìn)步,能夠更好更精準(zhǔn)地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高解析度;在內(nèi)容生成方面,採用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時(shí)空生成)技術(shù),聚焦自動(dòng)駕駛、工業(yè)製造、建築等多個(gè)行業(yè)場(chǎng)景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。

在端側,華為在盤(pán)古L0大模型的基礎(chǔ)上,專(zhuān)門(mén)針對(duì)終端消費(fèi)者場(chǎng)景中涉及的數(shù)據(jù)進(jìn)行了精細(xì)調(diào)優(yōu),構(gòu)建出一個(gè)L1的對(duì)話(huà)大模型,應(yīng)用到了小藝上,小藝在端側大模型的加持下,不僅可以通過(guò)自然語言對(duì)話(huà)更聰明地理解並執(zhí)行用戶(hù)指令,而且可以實(shí)現(xiàn)文本生成、摘要總結(jié)、多語種翻譯等功能,堪稱(chēng)是一個(gè)高效的生產(chǎn)力工具。同時(shí),小藝是越用越懂你,可以通過(guò)學(xué)習(xí)不斷進(jìn)步,儼然是一個(gè)私人智能助手。

在華為自主新一代盤(pán)古大模型5.0的加持下,小藝的能力也得到全面提升,擁有上萬(wàn)億tokens的知識量,可以智能感知23類(lèi)主要場(chǎng)景,提供300多種重點(diǎn)服務(wù),任務(wù)推理規(guī)劃(huà)的成功率高達(dá)90%。

今年4月華為發(fā)布的華為MateBook X Pro不僅首次應(yīng)用盤(pán)古大模型,還精選100+智能體,用戶(hù)可以一鍵直達(dá)豐富的AI應(yīng)用。在熱銷(xiāo)的問(wèn)界M9上,車(chē)載智慧助手小藝在AI大模型的加持下具有用車(chē)知識問(wèn)答、熱點(diǎn)資訊總結(jié)、百科知識問(wèn)答等功能,是車(chē)主用車(chē)過(guò)程中的得力助手。

在華為Mate60系列手機(jī)中備受用戶(hù)好評(píng)的AI雲增強(qiáng),同樣體現(xiàn)出華為雲在端雲協(xié)同上的能力。用戶(hù)拍攝圖片後,可以點(diǎn)擊圖片右上角的魔法棒圖標(biāo),從而對(duì)照片進(jìn)行智能分析,並將照片上傳到雲端進(jìn)行優(yōu)化,提升照片的清晰度和美感度。據(jù)了解,這項(xiàng)突破手機(jī)硬體限制的獨(dú)特功能,背後是通過(guò)華為雲KooVerse全球存算網(wǎng)調(diào)用雲端強(qiáng)大的算力,在雲端進(jìn)行AI推理,從而讓用戶(hù)在手機(jī)上實(shí)現(xiàn)專(zhuān)業(yè)級(jí)的照片效果。

除了雲拍照增強(qiáng)外,雲助端的典型場(chǎng)景還有雲助小藝及雲手機(jī)等,雲助小藝可以調(diào)用雲上千萬(wàn)級(jí)參數(shù)大模型,支撐千萬(wàn)級(jí)用戶(hù)在線(xiàn)推理,語音對(duì)話(huà)、AIGC在線(xiàn)創(chuàng)作及個(gè)性化推薦能力全面提升;雲手機(jī)場(chǎng)景下,通過(guò)華為雲全球存算網(wǎng)讓算力在近端部署,端到端時(shí)延<150ms,全面助力鴻蒙生態(tài)的繁榮。

事實(shí)上,盤(pán)古大模型的架構(gòu)天然契合端雲協(xié)同的特性。盤(pán)古大模型並不是一個(gè)大模型,而是一個(gè)大模型系列,包括「5+N+X」三層架構(gòu):L0層包括自然語言、視覺、多模態(tài)、預測(cè)、科學(xué)計(jì)算五大基礎(chǔ)大模型,可以滿(mǎn)足行業(yè)場(chǎng)景中的多種技能需求;L1層是N個(gè)行業(yè)大模型,基於通用大模型訓(xùn)練;L2層是更多細(xì)化場(chǎng)景的模型,場(chǎng)景包括政務(wù)熱線(xiàn)、網(wǎng)點(diǎn)助手、颱風(fēng)路徑預測(cè)等。在HDC 2024上,可以看到盤(pán)古大模型5.0包含不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務(wù)場(chǎng)景。十億級(jí)參數(shù)的Pangu E系列可支撐手機(jī)、PC等端側的智能應(yīng)用;百億級(jí)參數(shù)的Pangu P系列,適用於低時(shí)延、高效率的推理場(chǎng)景;千億級(jí)參數(shù)的Pangu U系列適用於處理複雜任務(wù);萬(wàn)億級(jí)參數(shù)的Pangu S系列超級(jí)大模型能夠幫助企業(yè)處理更為複雜的跨領(lǐng)域多任務(wù)。

盤(pán)古大模型的三層架構(gòu)完全解耦設(shè)計(jì),從而可以快速適配、快速滿(mǎn)足行業(yè)需求。華為之所以可以快速從L0的盤(pán)古大模型訓(xùn)練出L1的小藝端側大模型就是如此。

佛經(jīng)中常有「須彌納芥子」、「芥子納須彌」的說(shuō)法,巨大如須彌山這樣的存在都可以放入芥子這樣微小的東西裡面,意指佛法博大精深,以及修行之難。將雲側大模型放到端側,不也是如此嗎?不僅要放進(jìn)去,而且要能滿(mǎn)足特定場(chǎng)景需求,還要實(shí)現(xiàn)雲側和端側的協(xié)同配合,對(duì)廠(chǎng)商考驗(yàn)之大可想而知。

端雲協(xié)同的混合大模型才是AI的未來(lái)

總而言之,端雲協(xié)同的混合大模型才是AI的未來(lái)。

混合大模型,不僅可以結(jié)合端側和雲側的各自優(yōu)勢(shì),更是可以形成一種彼此促進(jìn)的飛輪效應(yīng)。雲側大模型可以向端側大模型輸(shū)出能力,而端側大模型可以向雲側大模型反饋執(zhí)行成效和端側新知識,進(jìn)而促進(jìn)雲側大模型不斷進(jìn)化,彼此推動(dòng),飛輪越轉(zhuǎn)越快。

這種混合大模型,不僅適用於C端,更是適用於B端。實(shí)際上,企業(yè)自己的專(zhuān)有大模型就像手機(jī)或者PC上的端側大模型一樣,擁有更好的安全以及更低的時(shí)延。對(duì)於企業(yè)來(lái)說(shuō),混合大模型既能打消其對(duì)於數(shù)據(jù)保護(hù)的顧慮,又能兼顧大模型在能力上的優(yōu)勢(shì)。如果說(shuō)手機(jī)和PC上的混合大模型加速了大模型進(jìn)入尋常百姓家,那麼,無(wú)疑,端雲協(xié)同的大模型可以加速大模型在千行萬(wàn)業(yè)上的落地。

在這方面,盤(pán)古大模型無(wú)疑具有獨(dú)特優(yōu)勢(shì)。就像華為常務(wù)董事、華為雲CEO張平安所說(shuō),「一直以來(lái),華為雲盤(pán)古大模型都堅(jiān)定的聚焦行業(yè),在解難題、做難事的道路上不斷攻堅(jiān)克難,砥礪前行」,盤(pán)古大模型生來(lái)就是深入千行萬(wàn)業(yè)的具體場(chǎng)景中,幫助客戶(hù)解決難題。

一方面,L0層的盤(pán)古大模型持續(xù)進(jìn)化,最新發(fā)布的盤(pán)古5.0在多模態(tài)、全系列、強(qiáng)思維三方面進(jìn)行升級(jí),越來(lái)越強(qiáng)大;另一方面,從L0到L1,盤(pán)古大模型可以結(jié)合行業(yè)公開(kāi)數(shù)據(jù)訓(xùn)練出行業(yè)通用大模型,也可以基於行業(yè)客戶(hù)自有數(shù)據(jù)訓(xùn)練出企業(yè)專(zhuān)有大模型;L2層則為客戶(hù)提供「開(kāi)箱即用」的模型服務(wù)。不同層級(jí)的大模型也是彼此促進(jìn),形成飛輪效應(yīng)。

可以預計(jì),越來(lái)越多的企業(yè)、行業(yè)都將能在端雲協(xié)同的混合大模型的加持下,加速數(shù)位化、智能化。混合大模型,必將為AI落地千行萬(wàn)業(yè)按下加速鍵。

  • 本期雜誌

  • 往期推薦